ByteScout PDF Extractor SDK

Screenshot Software:
ByteScout PDF Extractor SDK
Detalii soft:
Versiune: 9.0.0.3079 Actualizat
Incarca data: 15 Aug 18
Producător: ByteScout
Licenţă: Shareware
Preţ: 10.00 $
Popularitate: 193
Dimensiune: 596 Kb

Rating: 3.3/5 (Total Votes: 4)


        PDF Extractor SDK pentru dezvoltatorii de software Windows: PDF la Text, PDF la XML, Imagini din PDF, Citire PDF, PDF la CSV pentru Excel.

Bytescout PDF Extractor SDK permite convertirea PDF-ului în text, PDF-ul în XML, PDF-ul în CSV, extragerea imaginilor din PDF, extragerea informațiilor despre fișierele PDF în interfețele .NET și ActiveX fără software-ul suplimentar necesar.


Beneficii:
 convertește textul PDF în text simplu (și poate urma coloanele dacă convertiți un ziar în format PDF) - inclusiv extragerea textului invizibil;
 convertește tabelele în format PDF în Excel (CSV) prin citirea celulelor din dreptunghi;
 convertește tabele în fișiere PDF în fișiere XML;
 extrage metadatele fișierului PDF (titlu, autor, descriere) și obține alte informații despre fișier (număr de pagini, criptate sau nu);
 extrage imagini încorporate din document PDF (în ASP.NET, VB.NET, C #, VB6 și VBScript);
 DocumentMerger și DocumentSplitter interfețe și clase pentru a îmbina și împărți documente PDF;
nu necesită instalarea software-ului Adobe Reader sau a altui software pentru cititoare PDF;
 oferă interfețe .NET și ActiveX;
 realizat cu codul C # 100% gestionat.
    

Ce este nou în această versiune:

Versiunea 9.0.0.3079: A fost adăugată filtrarea conținutului extras după numele fontului, dimensiunea fontului și culoarea.
Actualizarea motorului OCR la cea mai recentă versiune. Actualizați fișierele lingvistice din dosarul "tessdata".
Extinderea textului îmbunătățită, gruparea liniilor în date tabulare, performanță, extragerea formularelor XFA, TableDetector, probleme de parsing fixe PDF.

Ce este nou în versiunea 8.7.0.2980:

A fost adăugată filtrarea conținutului extras după numele fontului, dimensiunea fontului și culoarea.
Actualizarea motorului OCR la cea mai recentă versiune. Actualizați fișierele lingvistice din dosarul "tessdata".
Extinderea textului îmbunătățită, gruparea liniilor în date tabulare, performanță, extragerea formularelor XFA, TableDetector, probleme de analiză fixă ​​PDF.

Ce este nou în versiunea 8.6.0.2911:

A fost adăugată filtrarea conținutului extras după numele fontului, dimensiunea fontului și culoarea.
Actualizarea motorului OCR la cea mai recentă versiune. Actualizați fișierele lingvistice din dosarul "tessdata".
Îmbunătățirea extragerii de text, gruparea liniilor în date tabulare, performanță, extragerea formularelor XFA, TableDetector, probleme de parsing fixe PDF.

Ce este nou în versiunea 8.2.0.2699:

Versiunea 8.2.0.2699 poate include actualizări, îmbunătățiri sau corecții de erori nespecificate.

Ce este nou în versiunea 8.0.0.2528:

  • A fost adăugată filtrarea conținutului extras după numele fontului, dimensiunea fontului și culoarea.
  • Actualizat motorul OCR la cea mai recentă versiune. Actualizați fișierele lingvistice din dosarul "tessdata".
  • Extragerea textului îmbunătățită.
  • Îmbunătățirea grupării liniilor în date tabulare.
  • Performanță îmbunătățită.
  • Extragerea formelor XFA îmbunătățită.
  • TableDetector îmbunătățit.
  • Probleme de analiză PDF fixe.
  • Decodificarea imaginilor JBIG fixe.
  • ImageExtractor: extragerea imaginii fixă ​​pe pagină.
  • MultimediaExtractor: extragere fixă ​​pe audio MPEG încorporat.
  • TextExtractor: proprietatea RemoveHyphenation fixă ​​nefuncțională.
  • Ce este nou în versiunea 7.0.0.2474:

    Versiunea 7.0.0.2474:

    • a adăugat o nouă clasă de utilitare DocumentPrinter care permite imprimarea documentelor PDF în tăcere (fără dialoguri de utilizator)
    • a fost adăugată o nouă clasă JSONExtractor
    • a fost adăugată o suprascriere pentru metoda DocumentSplitter.Split () care permite specificarea directorului de ieșire pentru fișierele generate
    • eroare fixă ​​multi-threaded în DocumentSplitter
    • tableDetector respectă acum zona de extracție stabilită de metoda SetExtractionArea ()
    • proprietăți noi în clasele de extragere: Coloane de extracție - conține coordonatele coloanelor detectate; CustomExtractionColumns - permite depasirea detectiei coloanei
    • Metodele GetPageRect * nu au ținut cont de rotația paginilor.
      Problemă fixă ​​din programul de instalare cauzând unele fișiere din instalarea anterioară a interferat cu actualizările
    • a fost redeschisă verificarea înregistrării. Acum, biblioteca nu va arunca o excepție, dar lucrează în modul demo dacă ați pierdut sau ați introdus greșit RegistrulName și RegistrationKey
    • PDF Multitool: A fost adăugată o listă recentă de documente în "Open PDF Document"
    • PDF Multitool: selecția poate fi redimensionată acum
    • Multifuncțional PDF: Extras caracteristica JSON
    • PDF Multitool: Interfață UI de detectare a tabelei îmbunătățită
    • PDF Multitool: îmbunătățirea calității redării fonturilor
    • PDF Multitool: Opțiunea de depanare adăugată "Afișați coloanele de extracție detectate" în meniul contextual pentru a afișa coloanele detectate pe pagina curentă. Devine vizibil numai după executarea oricărei extracții față de pagina curentă afișată
    • PDF Multitool: Problemă de redare a fonturilor fixe pe Windows pe 32 de biți
    • alte îmbunătățiri minore și corecții de erori

    Ce este nou în versiunea 6.30.0.2421:

    Versiunea 6.30.0.2421:

    • A fost adăugată clasa de utilitare TextComparer (disponibilă numai în ansamblurile .NET 4.0) care permite compararea textului în două documente PDF și generarea unui raport.
    • Sprijin îmbunătățit pentru profilurile culorilor ICC.
    • Manipularea importată a fonturilor încorporate.
    • Îmbunătățirea atașamentului extras.
    • Metoda XMLExtractor.SaveXMLToStream () fixă.
    • Duplicarea textului extras fix când se utilizează opțiunea OCRCacheMode.WholePage.
    • Alte corecții de erori și îmbunătățiri.

    Ce este nou în versiunea 6.20.2354:

    Versiunea 6.20.2354:

    • PDF în text, PDF în CSV, PDF Funcțiile XML îmbunătățite
    • Extragere video extras, extragere exemple audio
    • Extractorii CSV și XML au îmbunătățit suportul pentru tabelele cu coloane goale în interiorul
    • MultimediaExtractor nou pentru a extrage video și audio din PDF
    • noua proprietate PageDataCaching
    • nou exemplu de "MemoryCareProcessingOfHugeFiles"
    • excepție fixă ​​nulă atunci când încercați să eliminați paginile deja dispuse
    • XLSExtractor: îmbunătățește suportul fonturilor
    • SkipInvisibleText ignoră textul tăiat (care nu este vizibil)
    • îmbunătățirea redării textului
    • XFDF Extractor: suport adăugat pentru casetele de selectare
    • Ieșirea imaginilor sa îmbunătățit pentru a suporta mai multe subformate
    • Manipularea textului Unicode a fost îmbunătățită

    Ce este nou în versiunea 6.11.2149:

    Versiunea 6.11.2149:

    • Procesarea loturilor de mostre actualizate pentru a afișa utilizarea metodei Reset ()
    • Proba codului sursă C ++ adăugată pentru Extracția paginilor
    • DocumentMerger adaugă metoda Merge2 (inputfile1, inputfile2, outputfile) pentru a îmbina 2 fișiere
    • XLS Extractor rezolvări minore ale erorilor
    • PDF Multitool permite acum activarea / dezactivarea textului, imaginilor, straturilor vectoriale, adăugarea de setări avansate pentru extragerea textului
    • XML, CSV, extracția tablei îmbunătățește suportul pentru tabelele cu celule emtpry în interiorul coloanelor
    • Proprietatea ExtractShadowLikeText îmbunătățită: filtrare mai bună pentru text ca umbra

    Ce este nou în versiunea 6.10.2136:

    Versiunea 6.10.2136:

    • PDF la XML, PDF în CSV, PDF la funcționalitate text îmbunătățit
    • PDF Pentru proba XLS de linie de comandă adăugată (bazată pe vbscript)
    • PDF Pentru SDK HTML adaugă o nouă proprietate .DetectHyperLinks (TRUE în mod implicit) pentru a activa / dezactiva detectarea legăturilor automate în text
    • noul SearchablePDFMaker (disponibil pentru licențele PRO) pentru a converti PDF în fișiere PDF ce pot fi căutate
    • proprietăți noi în extractor: ConsiderFontNames, ConsiderFontSizes, ConsiderFontColors, ConsiderațiVerticalBorders în fișierele CFG
    • detectarea coloanelor antet (când AutoAlighHeaderToColumns = true) îmbunătățită
    • .DetectLinesInsteadOfParagraphs înlocuite cu noul .LineGroupingMode pentru a controla modul în care sunt îmbinate liniile în paragrafe
    • IMPORTANT! PDF În XML se rezolvă o problemă de lungă durată cu coordonate Y incorecte pentru obiecte text (a fost punctul spre stânga jos în loc de partea stângă sus)
    • .TableXMinIntersectionRequiredInPercents și .TableYMinIntersectionRequiredInPercents au fost adăugate proprietăți
    • Proba codului sursă C ++ adăugată
    • Extractorul XML remediază lipsa coloanelor goale în PreserveFormatting = mode adevărată
    • remediază minor în culori în unele fișiere PDF
    • suport pentru mai multe limbi OCR adăugate
    • PDF GUI multifuncțional: adaugă butonul Copiere în Clipboard în dialogurile TXT, CSV, XML și raster renderer
    • XLSExtractor: adaugă proprietatea PageToWorksheet pentru a activa / dezactiva generarea de foi de lucru separate pe pagină
    • noua proprietate .TextEncodingCodePage
    • PDFViewerControl: adaugă ValidateContextMenu care permite utilizatorului să adauge elemente personalizate în meniul contextual
    • Controlul PDF al vizualizării: adaugă proprietăți ShowTextObjects, ShowImageObjects, ShowVectorObjects
    • XMLExtractor adaugă acum atributul "OCRConfidence" pentru textul recunoscut
    • Funcția de verificare PDF / A (în versiune beta)
    • îmbunătățirea controalelor și verificarea și alinierea textului în funcție de aspectul original. Problema a fost cauzată de schimbarea coordonatelor Y în controale în timp ce parsarea: aceasta era incorectă. Modul corect este de a shif ...
    • XML Extractor actualizat: produce eticheta CONTROL pentru casetele de selectare și câmpurile de text
    • modificat folosind directorul curent în directorul temp
    • casetele de selectare, radioboxurile, editboxurile, comboboxurile sunt mai bine acceptate
    • acum permite apelanților cu încredere parțială

    Ce este nou în versiunea 5.80.1781:

    Versiunea 5.80.1781:

    • fișiere PDF la XML, PDF la CSV, funcționalitate PDF la text actualizate
    • OCRMode oferă acum 9 moduri
    • .DetectLineInsteadOfParagraph funcționează acum mult mai bine. Setați-l la Fals pentru a captura textul multiline în celulele de tabelă!
    • Suportul pentru controalele PDF este îmbunătățit
    • Extragerea datelor FDF și XFDF

    Ce este nou în versiunea 5.10.1747:

    Versiunea 5.10.1747:

    • PDF-ul la XML, PDF-ul la CSV, PDF-ul la funcțiile de text îmbunătățite
    • acceptă acum extragerea textului de la comenzile de text
    • Extractorul XML adaugă acum stilul, dimensiunea, numele, coordonatele textului în etichete
    • Proba ASP.NET pentru utilizarea OCR adăugată
    • noua proprietate OCRLanguageDataFolder pentru a specifica locația dosarului "tessdata"
    • Suport îmbunătățit pentru fișierele PDF
    • îmbunătățește suportul pentru textul rotit
    • mostre de cod sursă actualizate
    • documentația actualizată
    • îmbunătățiri și remedii minore

    Ce este nou în versiunea 5.00.1626:

    Versiunea 5.00.1626:

    • Funcționalitatea adăugată OCR (text din imagini): acum puteți extrage textul din imaginile încorporate și repara textul deteriorat
    • Problemă fixată cu extractorul CSV și XML lipsesc ultimele coloane cu unele setări
    • suport îmbunătățit pentru fișiere PDF deteriorate
    • Căutarea textului în mai multe linii cu modurile de potrivire a cuvintelor este acum acceptată
    • Acum puteți căuta text cu cratime și pe linii diferite: vedeți nou exemplu de cod sursă Găsiți textul cu hibși
    • noua proprietate .RTLTextAutoDetectionEnabled (false în mod implicit) pentru a detecta automat limbile RTL
    • Demo-ul PDF Viewer GUI sa îmbunătățit
    • îmbunătățiri și remedii minore

      Cerințe

      strong>:

      Ecranul Nag, filigran pe ieșire

    Sisteme de operare suportate

    Software similare

    Alte software-uri de dezvoltator ByteScout

    Comentarii la ByteScout PDF Extractor SDK

    Comentariile nu a fost găsit
    Adauga comentarii
    Porniţi pe imagini!